#爬取网页上指定内容
import requests
from lxml import etree

requests.packages.urllib3.disable_warnings()
response = requests.get('https://www.cnblogs.com/adampei-bobo/p/9414586.html', timeout=2, verify=False)
#在各种浏览器打开的任意页面上使用F12功能键，即可使用开发者工具，在窗口console标签下，键入 "document.charset" 即可查看网页的编码方式。
#response.encoding='GBK'
text=response.text
print('text:',text)
tree = etree.HTML(text)
#xpath值从chrome里取
li_list = tree.xpath('//*[@id="cnblogs_post_body"]/ul[1]/li[2]')
print(li_list[0].text)
print(li_list[0].tag)
print(li_list[0].attrib)
